DeepSeek V4

DeepSeek 下一代旗舰开源 MoE 模型，Preview 已于 2026-04-24 发布（web / app / API 同步上线，开源权重见 Hugging Face），分 V4-Pro（1.6T MoE，MIT 许可） 与 V4-Flash（284B，低成本推理） 两档，均支持 1M token 上下文，重点突破 Agent 能力与顶级推理，对标 GPT-5 / Claude Opus 4。

关键规格（V4 Preview，2026-04-24 发布）

维度	V4-Pro	V4-Flash
发布	2026-04-24（Preview）（据 DeepSeek API Docs，T1）	同上
参数	1.6T 总（MoE）	284B
上下文	1M tokens	1M tokens
许可证	MIT 完全开源 + Hugging Face 开源权重	开源权重
架构	混合注意力（Compressed Sparse Attention CSA + Heavily Compressed Attention HCA）；单 token 推理仅需 V3.2 的 ~27% FLOPs、~10% KV cache	轻量化，主打低延迟低成本

[!info] 上一代衔接 V4 之前 DeepSeek 最后一次发布是 V3.2（及 V3.2 Speciale）于 2025-12；legacy deepseek-chat / deepseek-reasoner API 别名将于 2026-07-24 退役。

市场定位

V4 关键看点：

延续"低成本震撼"叙事：V4-Pro 单 token 推理 FLOPs 仅为 V3.2 的约 27%、KV cache 约 10%，把效率优势进一步拉开
Agent / 推理能力：官方强调 V4 Preview 具备更强 Agent 能力与顶级推理
算力来源：仍受美国 2024-12 H100/H800 禁令收紧影响（专有判断，以 4-02-模型工厂内部研究为准）

客户与部署

web / app / API 三端 + Hugging Face 开源权重；企业自部署 + 多家云厂商托管

演进路线

DeepSeek V3（2024-12）→ DeepSeek R1（2025-01, 推理专精分支）→ V3.2（2025-12）→ DeepSeek V4 Preview（2026-04-24，V4-Pro 1.6T / V4-Flash 284B）

已废弃叙述

2026-05-29 事实订正：本页原把 V4 当"未发布路线图"，实际 V4 Preview 已于 2026-04-24 发布（早于本页创建日）；规格由推测的"1T+/512K+"更正为实际"V4-Pro 1.6T / V4-Flash 284B / 1M 上下文"。依据 DeepSeek 官方 API Docs（T1）+ 多家 T2 报道

DeepSeek 下一代旗舰开源 MoE 模型（路线图，预计 2025-H2 ~ 2026 发布），是 DeepSeek V3 的升级版，重点突破多模态、长上下文（512K+）和 Agent 能力，目标对标 GPT-5 / Claude Opus 4 全面能力。

关键规格（路线图，未发布）

维度	路线图推测
发布	2025-H2 ~ 2026-H1
参数	1T+ 总（MoE）/ 激活规模待定
上下文	512K+ tokens
模态	原生多模态（文本+图像+视频）
训练数据	25T+ tokens（推测）
训练硬件	H800 + 部分国产芯片（受美国 2024-12 出口管制影响）

注：V4 正式规格 DeepSeek 尚未公布，本页 confidence: medium 反映路线图不确定性

演进路线（旧）：DeepSeek V3（2024-12）→ DeepSeek R1（2025-01, 推理专精分支）→ DeepSeek V4（2025-H2 ~ 2026-H1）

关联

↑ up::DeepSeek 幻方量化 ↓ down::4-04-模型部署与优化 ⚔ competitor::GPT-5 Claude Opus 4 Llama 4 ∈ belongs_to::4-02-模型工厂